“데이터 관리가 AI 비용 줄인다” 퓨어스토리지가 제시하는 데이터 플랫폼 최적화 전략

모든 기업이 자체적으로 LLM 모델을 개발하는 것은 아니며, 기존 LLM을 비즈니스에 더 적합하게 조정하거나 완전히 구축된 솔루션을 서비스하는 전략을 세우기도 한다. 하지만 어떤 형태로 도입하더라도 효율적인 관리를 위해서는 최소한의 GPU 서버 구축이 요구된다. 여기에 스토리지 및 네트워크와 같은 추가 비용을 더하면 투자 금액은 더 늘어날 수 있다. 기업들이 이런 AI 인프라 비용을 고민하는 가운데, 3월 26일 CIO코리아, IT월드, IDC가 공동 주최한 ‘클라우드&AI 인프라스트럭처 서밋 2025’에서 퓨어스토리지 엔터프라이즈 프리세일즈 부문의 김진환 이사는 AI 비용을 절감하고 투자 대비 효과(ROI)를 구체화하기 위해 데이터 플랫폼을 최적화할 것을 제안했다. 김진환 이사는 “AI 학습의 모델링 주기를 단축하도록 데이터 플랫폼을 최적화해야 개발에 필요한 자원을 줄이고 ROI를 개선할 수 있다”라고 설명했다.
모델링 주기를 단축하는 4가지 방법
그렇다면 구체적으로 어떻게 AI 모델링 주기를 단축할 수 있다는 걸까? 아나콘다의 2020년 설문조사에 따르면, AI 모델링에 필수적인 역할을 하는 데이터 과학자는 업무 시간의 3분의 2를 데이터 수집, 정리, 시각화 등 ‘데이터 준비 단계’에 할애하는 것으로 나타났다. 다시 말해 나머지 3분의 1에서 아무리 효율성을 높이더라도 데이터 준비 시간을 줄이지 못하면 전체 모델링 주기를 단축하기 어려울 수 있다는 것이다. 김진환 이사는 “데이터는 말 그대로 AI의 연료”라고 언급하며, 기업이 이 문제를 개선하는 데 필요한 4가지 고려사항을 소개했다.
AI 워크플로우 구성도
pure storage
첫째는 효율적인 데이터 저장소 구축이다. 즉, 데이터 저장소가 잘 구축돼야 좋은 모델을 위한 초석이 마련될 수 있다는 설명이다. 데이터 저장소는 모델 교육에 필요한 양질의 데이터 확보를 뒷받침해야 하며, 다양한 형태로 여러 위치에 저장된 데이터를 쉽게 통합할 수 있는 플랫폼을 갖춰야 한다. 또한 원하는 데이터에 빠르게 액세스해서 가져오고 훈련시킬 수 있는 데이터 서비스 연속성도 요구된다.